花费 34 ms
Apriori算法介绍(Python实现)

导读: 随着大数据概念的火热,啤酒与尿布的故事广为人知。我们如何发现买啤酒的人往往也会买尿布这一规律?数据挖掘中的用于挖掘频繁项集和关联规则的Apriori算法可以告诉我们。本文首先对Apr ...

Mon Apr 17 06:16:00 CST 2017 8 62621
机器学习中特征的处理及选择

##基础概念 特征工程是通过对原始数据的处理和加工,将原始数据属性通过处理转换为数据特征的过程,属性是数据本身具有的维度,特征是数据中所呈现出来的某一种重要的特性,通常是通过属性的计算,组合或转换 ...

Fri Apr 27 06:59:00 CST 2018 0 28998
贝叶斯分类

朴素贝叶斯分类 1.1、摘要 贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。本文作为分类算法的第一篇,将首先介绍分类问 ...

Fri Feb 07 23:53:00 CST 2014 1 46521
数据挖掘十大经典算法

一、C4.5 C4.5,是机器学习算法中的一个分类决策树算法,它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法ID3的改进算法,所以基本上了解了一半决策 ...

Mon Jul 27 02:41:00 CST 2015 0 35694
机器学习中的类别不均衡问题

##基础概念 类别不均衡是指在分类学习算法中,不同类别样本的比例相差悬殊,它会对算法的学习过程造成重大的干扰。比如在一个二分类的问题上,有1000个样本,其中5个正样本,995个负样本,在这种情况 ...

Fri Apr 20 06:06:00 CST 2018 0 14303
数据挖掘150道笔试题

数据挖掘150道笔试题 作者:白宁超 2016年10月16日13:44:06 摘要:正值找工作之际,数据挖掘150道面试题涵盖很多基础知识点,如果你针对求职提前针对性准备,可以以此为为参照 ...

Sun Oct 16 21:53:00 CST 2016 0 20431
数据挖掘十大算法之—C4.5

C4.5是一系列用在机器学习和数据挖掘的分类问题中的算法。它的目标是监督学习:给定一个数据集,其中的每一个元组都能用一组属性值来描述,每一个元组属于一个互斥的类别中的某一类。C4.5的目标是通 ...

Thu Jul 26 06:47:00 CST 2012 3 39452
机器学习——LightGBM

###基础概念 LigthGBM是boosting集合模型中的新进成员,它和xgboost一样是对GBDT的高效实现,很多方面会比xgboost表现的更为优秀。原理上它和GBDT及xgboot类似 ...

Sun Jul 22 00:12:00 CST 2018 1 8117
机器学习——超参数搜索

###基础概念 超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。通常情况下,在机器学习过程中需要对超参数进行优化,给学习器选择一组最优超参数,以提高学习的性能和效果。比如,树 ...

Wed Jul 18 06:33:00 CST 2018 0 7832

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM